MAE0552 - Introdução à Teoria da Informação
Projeto final: Um estudo sobre o sequenciamento genético e sua relação com características dos indivíduos
| Ana Luisa Pinheiro | 11810407 | |
| Ayrton Amaral | 11288131 | |
| Bruno Groper Morbin | 11809875 | |
| Caio Febronio | 11811482 |
Instituto de Matemática e Estatística - Universidade de São Paulo | Julho, 2023
Para cada indivíduo pertencente ao estudo, foram amostrados genes individuais e realizada a medição da intensidade da luz em cima de cada um deles. O banco de dados disponibilizará os valores dessa intensidade individualmente para cada gene de cada indivíduo.
Com base no banco de dados, queremos verificar se existe alguma relação entre esses valores da intensidade da luz em cima de cada gene com características pessoais de cada indivíduo.
Para a resolução do problema, agruparemos os genes pelo valor da intensidade de luz e utilizaremos a informação mútua vista em aula para checarmos se os genes introduzidos em cada cluster possuem distribuição parecida ou não. Após essa checagem, será feita uma distribuição única da intensidade de luz para cada cluster e a mesma será utilizada para caracterizar cada conjunto de cluster em relação às características do indivíduo.
# Carregando pacotes
library(tidyverse)
library(dplyr)
library(cluster)
library(infotheo)
library(stringr)
library(patchwork)load("glioma.RData") # geneInfo ; gliomaGSE52009 ; targetInfoGlioma
glioma <- gliomaGSE52009; as.data.frame(glioma)